摘要。差异隐私是一个数学概念,可提供信息理论安全保证。虽然差异隐私已成为确保数据共享隐私的事实上的标准,但实现该隐私的已知机制带有一些严重的限制。公用事业保证通常仅适用于固定的先验指定的查询集。此外,没有任何更复杂的效用保证,但很常见,包括聚类或分类等机器学习任务。在本文中,我们克服了其中一些局限性。使用指标隐私(一种强大的差异隐私概括),我们开发了一种多项式时间算法,该算法从数据集中创建私人度量。这种私人措施使我们能够有效地构建用于广泛统计分析工具准确的私人合成数据。此外,我们证明了私人措施和一般紧凑型度量空间中的合成数据的渐近敏锐的最低最大结果,对于远离零界限的任何固定隐私预算。我们结构中的一个关键成分是一个新的超规则随机步行,其步骤的联合分布与独立的随机变量一样规则,但是它们会缓慢地与原点偏离原点。
主要关键词